ANÁLISE DA RELAÇÃO ENTRE RENDA E DESEMPENHO NO ENEM: ESTUDO DE CASO BASEADO EM INTELIGÊNCIA ARTIFICIAL PARA DIFERENTES REGIÕES BRASILEIRAS

  • Autor
  • Tarcísio Alex Almeida de Paula
  • Co-autores
  • Ana Clara Oliveira Fernandes , Ana Laura Bastos , Hiury Rodrigo da Silva Alves , Julianny Albuquerque Lima , Kaio Gefferson de Almeida Mesquita , Kauã Silva do Nascimento
  • Resumo
  • Introdução: O presente estudo integra um projeto de Iniciação Científica que busca compreender as desigualdades educacionais no Brasil, com foco na relação entre a renda familiar, a localidade e o desempenho dos estudantes no Exame Nacional do Ensino Médio (ENEM). Considerando a importância do ENEM como mecanismo de acesso ao ensino superior e os contrastes socioeconômicos entre as regiões brasileiras, o trabalho propõe investigar como esses fatores influenciam o rendimento estudantil. Para isso, será realizada uma análise de dados com apoio de modelos de inteligência artificial, visando identificar pontos críticos de influência no desempenho e contribuir com evidências para a formulação de políticas públicas educacionais. A base de dados utilizada para esta análise é proveniente dos microdados do ENEM, disponibilizados pelo INEP por meio do portal de dados abertos: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/enem. Como etapa preliminar da investigação, foi elaborada uma matriz de correlação entre variáveis socioeconômicas e as notas dos participantes, com o intuito de explorar possíveis relações estatísticas relevantes. Objetivo: Analisar a correlação entre a renda per capita familiar e o desempenho dos estudantes no ENEM 2023, observando as variações dessa relação entre as diferentes regiões do Brasil por intermédio de modelos de inteligência artificial. Metodologia: Tipo de estudo: Estudo descritivo, com abordagem quantitativa. Período: março a maio de 2025. Etapas: (i) Coleta dos dados (Obtenção da base de dados do ENEM 2023 disponibilizada pelo) INEP. (ii) Limpeza e tratamento dos dados (Remoção de registros com valores nulos ou inconsistentes; Exclusão de colunas irrelevantes para o objetivo do estudo; Padronização de formatos. (iii) Análise exploratória (Elaboração de uma matriz e gráfico de correlação entre variáveis socioeconômicas e notas dos participantes; A partir dessa análise, observou-se que as variáveis Q006 - renda familiar e Q024 - posse de acesso à internet em casa apresentaram as correlações mais significativas com o desempenho dos estudantes, indicando sua relevância no modelo preditivo). (iv) Complementação da base de dados (Inserção do Índice de Desenvolvimento Humano (IDH) correspondente ao estado de cada participante; Identificação se o participante reside em zona rural ou urbana, com base em informações de município e localidade). (v) Equalização das bases (Balanceamento das variáveis para evitar viés no modelo; Normalização ou padronização dos dados numéricos (como renda e notas). (vi) Treinamento do modelo de IA (Escolha e aplicação de algoritmos de regressão para prever as notas dos estudantes com base nos dados tratados; Divisão entre conjunto de treino e teste para avaliação de desempenho do modelo). (vii) Análise dos resultados (Verificação dos fatores com maior influência nas previsões; Interpretação dos padrões encontrados a partir das variáveis socioeconômicas e regionais). Sujeitos envolvidos: Estudantes inscritos no ENEM 2023 com dados válidos sobre rendimento e informações socioeconômicas. Materiais: Utilizou-se a base de microdados do ENEM 2023 disponibilizada no site do GOV.BR. As análises foram realizadas com o uso da linguagem Python, com apoio das bibliotecas Pandas, NumPy e Seaborn. Resultados parciais e Discussão: Até o momento, a equipe concentrou esforços nas etapas iniciais do projeto, realizando o levantamento e a organização da base de dados do ENEM 2023. Foi possível identificar a complexidade e o volume dos dados, o que exigiu um trabalho minucioso de filtragem e limpeza, removendo registros incompletos ou inconsistentes. Também foi iniciada a integração de informações externas, como o IDH dos estados e a classificação das localidades como zonas urbanas ou rurais. A partir dessa experiência, observamos a importância de uma preparação rigorosa dos dados para garantir a qualidade das análises e a eficácia do modelo de IA que será treinado posteriormente. A equipe destaca, ainda, o desenvolvimento de habilidades técnicas e analíticas como parte relevante do processo de pesquisa. Considerações finais: O projeto, ainda em fase de desenvolvimento, possibilitou a coleta e o tratamento dos dados do ENEM 2023, além da integração de informações socioeconômicas e regionais, como o IDH e a classificação urbana/rural. Também foi iniciada a análise desses dados, utilizando métodos como a matriz de correlação para verificar quais variáveis exercem maior influência sobre o desempenho dos candidatos. Como contribuição, destaca-se o desenvolvimento de uma base consolidada que permitirá análises mais precisas sobre desigualdades educacionais, bem como de um modelo capaz de prever a nota do candidato com base em dados socioeconômicos e de localidade. A experiência também proporcionou o aprimoramento de habilidades técnicas da equipe, como a análise minuciosa de dados e a construção de modelos preditivos. Como limitação, observa-se a complexidade e o tempo necessário para preparar e equilibrar os dados antes do treinamento do modelo de IA, o que pode impactar o cronograma previsto.

  • Palavras-chave
  • Inteligência Artificial. Análise socioeconômica. Análise regional. ENEM. Modelagem.
  • Modalidade
  • Pôster
  • Área Temática
  • Ciências Tecnológicas
Voltar Download

II Jornada Científica do PROMIC 2025 é uma iniciativa promovida pela Coordenadoria de Pesquisa e Monitoria (COOPEM) da Unifametro, com o objetivo de fomentar a divulgação e o acompanhamento do progresso dos projetos desenvolvidos no âmbito do Programa de Monitoria e Iniciação Científica (PROMIC).

Este evento celebra a dedicação de alunos e professores na construção do conhecimento científico, proporcionando um espaço para o intercâmbio de ideias, a reflexão crítica e o incentivo à produção acadêmica de excelência. Por meio da apresentação de resultados parciais e finais das pesquisas, a Jornada busca não apenas estimular o aprendizado interdisciplinar e o pensamento inovador, mas também reforçar o compromisso da Unifametro com a formação integral de seus discentes.

Convidamos todos a explorar os anais deste evento, que representam um marco significativo na trajetória acadêmica e científica da instituição, evidenciando o papel transformador da pesquisa na construção de uma sociedade mais justa e sustentável.

Normas para Submissão de Resumos Simples

Os resumos a serem submetidos à II Jornada Científica do PROMIC 2025 devem ser elaborados e formatados de acordo com as seguintes diretrizes:

1. Estrutura do Resumo

Título

  • Fonte: Arial ou Times New Roman, tamanho 14.
  • Estilo: Negrito, caixa alta e centralizado.

Autores

  • Inserir o(s) nome(s) completo(s) (Exemplo: Maria de Sousa Silva).
  • Fonte: Arial ou Times New Roman, tamanho 12.
  • Estilo: Negrito e alinhado à direita.

Informações adicionais

  • Modalidade/Vinculação/Curso: Indicar a modalidade (ex.: Monitor Bolsista - Fisioterapia).
  • E-mail para contato: Inserir o e-mail do autor principal (exemplo: maria.silva@aluno.unifametro.edu.br).
  • Fonte: Arial ou Times New Roman, tamanho 10.
  • Alinhamento: À direita.

Classificações

  • Área Temática: Indicar a área correspondente.
  • Área de Conhecimento: Selecionar a área.
  • Modalidade: Escolher a modalidade adequada.

Corpo do Resumo

  • Estrutura do texto: Deve incluir as seguintes seções:
    • Introdução: Contextualizar o projeto, justificar as atividades e problematizar o tema.
    • Objetivo: Descrever o objetivo principal do trabalho.
    • Metodologia: Informar o tipo de estudo, período de realização, sujeitos envolvidos e materiais/processos utilizados.
    • Resultados parciais e Discussão: Apresentar os resultados alcançados até o momento ou descrever as experiências observadas.
    • Considerações finais: Sintetizar os resultados, contribuições e limitações do projeto.
  • Fonte: Arial ou Times New Roman, tamanho 12.
  • Espaçamento: Simples, justificado.

Palavras-chave

  • Inserir de 3 a 5 palavras-chave separadas por ponto final.
  • Fonte: Arial ou Times New Roman, tamanho 12.

Referências

  • Devem incluir apenas obras mencionadas no resumo.
  • Seguir as normas da ABNT para formatação de referências.

2. Formatação Geral

  • Extensão máxima: Até 300 palavras (excluindo título, autores, palavras-chave e referências).
  • Margens: Superior e inferior de 2,5 cm; esquerda e direita de 3 cm.
  • Formato: Documento em Word (.doc ou .docx).

3. Submissão

  • Os resumos deverão ser enviados através da plataforma oficial do evento, respeitando os prazos estipulados.
  • Resumos fora do padrão ou com formatação inadequada poderão ser devolvidos para ajustes ou rejeitados.

Essas normas visam padronizar os trabalhos apresentados, garantindo a qualidade e a organização dos anais da II Jornada Científica do PROMIC 2025.

  • Ciências da Saúde
  • Ciências Tecnológicas
  • Ciências Sociasi Aplicadas

Comissão Organizadora

Gabriella de Assis Wanderley
Antônio Adriano da Rocha Nogueira
Kauã Alexsander Gomes Carvalho

Comissão Científica

Antônio Adriano da Rocha Nogueira
Kauã Alexsander Gomes Carvalho

 

A Comissão Científica permanece à disposição pelo e-mail coopem@unifametro.edu.br e presencialmente na sala da Coordenadoria de Pesquisa e Monitoria (COOPEM) localizada no Campus Carneiro da Cunha do Centro Universitário Fametro - Unifametro.